新的天文任务通常与已经收集的标签的早期任务有关。我们将对比度框架BYOL调整为利用这些标签作为预处理的任务,同时还可以增强不变性。对于大规模预处理,我们介绍了GZ-EVO V0.1,这是552K星系图像的9650万志愿者响应,再加上另外134万个可比较的未标记星系。206 GZ-EVO答案中的大多数对于任何给定的星系都不为人所知,因此我们的预读任务使用了自然处理未知答案的差异损失。在有或没有混合学习的情况下,GZ-EVO预训练即使有很多下游标签(44K标签的精度为+4%)也可以改善直接训练。我们的混合预处理/对比方法进一步提高了下游准确性,而对比度学习或对比度学习,尤其是在低标签转移方案中(具有750个标签的6%精度)。
translated by 谷歌翻译
在这项工作中,我们使用变分推论来量化无线电星系分类的深度学习模型预测的不确定性程度。我们表明,当标记无线电星系时,个体测试样本的模型后差水平与人类不确定性相关。我们探讨了各种不同重量前沿的模型性能和不确定性校准,并表明稀疏事先产生更良好的校准不确定性估计。使用单个重量的后部分布,我们表明我们可以通过从最低信噪比(SNR)中除去权重来修剪30%的完全连接的层权重,而无需显着损失性能。我们证明,可以使用基于Fisher信息的排名来实现更大程度的修剪,但我们注意到两种修剪方法都会影响Failaroff-Riley I型和II型无线电星系的不确定性校准。最后,我们表明,与此领域的其他工作相比,我们经历了冷的后效,因此后部必须缩小后加权以实现良好的预测性能。我们检查是否调整成本函数以适应模型拼盘可以弥补此效果,但发现它不会产生显着差异。我们还研究了原则数据增强的效果,并发现这改善了基线,而且还没有弥补观察到的效果。我们将其解释为寒冷的后效,因为我们的培训样本过于有效的策划导致可能性拼盘,并将其提高到未来无线电银行分类的潜在问题。
translated by 谷歌翻译
在这项工作中,我们使用出生的机器在时域射频天文学中引入了一种新的脉冲轨分类问题的方法,通常称为A \ EMPH {量子神经网络}。使用单个qubit架构,我们表明脉冲节分类问题很好地展示了Bloch球体,并且可以实现更加古典机器学习方法的可比精度。我们介绍了一种用于本工作中使用的Pulsar数据的新型单QUBET编码,并表明这与多Qubit Qaoa编码相当执行。
translated by 谷歌翻译
在这项工作中,我们使用变分推论在无线电星系分类的模型预测中量化的认知性不确定性,并表明在标记无线电星系时,各个测试样本的模型后差水平与人类不确定性相关。我们探讨了各种不同重量前沿的模型性能和不确定性校准,并表明稀疏事先产生更良好的校准不确定性估计。使用各个权重的后部分布,我们表明信噪比(SNR)排名允许将完全连接的层灌浆到30 \%的水平,而无需显着损失性能,并且这种修剪增加了预测性不确定性在模型中。最后,我们表明,与此领域的其他工作一样,我们经历了冷的后效。我们检查是否在我们的模型中调整成本函数以适应模型拼盘可以弥补这种效果,但发现它没有显着差异。我们还研究了原则数据增强的效果,并发现它改善了基线,但不会完全弥补观察到的效果。我们将其解释为寒冷的后效,因为我们的培训样本过于有效的策划导致可能性拼盘,并将其提高到未来无线电银行分类的潜在问题。
translated by 谷歌翻译
在这项工作中,我们介绍了集团的自我关注模型,以解决天文学中解释的无线电星系分类问题。我们评估了循环和二对角等方面的各种订单,并表明包括标准性,因为之前的两者都减少了适合数据所需的时期的数量,并导致改进的性能。在使用自我关注作为可解释的模型时,我们突出了方向的好处,并说明了如何在统计上参加他们作为人类天文学家的分类中的同样特征的统计学上。
translated by 谷歌翻译
在这项工作中,我们在现代射频天文学中应用于形态分类时,研究了最先进的半监督学习(SSL)算法的鲁棒性。我们测试SSL是否可以在使用较少的标记数据点时实现与本领域的当前监督状态相当的性能,以及这些结果概括使用真正未标记的数据。我们发现,尽管SSL提供了额外的正常化,但在使用很少的标签时,其性能迅速降低,并且使用真正未标记的数据导致性能显着下降。
translated by 谷歌翻译
天文学家通常已经着手通过从头开始创建自己的表示来解决监督的机器学习问题。我们表明,经过训练的深度学习模型,可以回答每个星系动物园贴花问题问题,即学习星系的有意义的语义表示,这些语义表示对于从未训练过的新任务很有用。我们利用这些表示形式优于最近对研究大型星系样本至关重要的实际任务的方法。第一个任务是识别与查询星系相似的形态的星系。给定一个星系为人类分配了一个免费文本标签(例如“ #diffuse”),我们可以找到与大多数标签匹配该标签的星系。第二个任务是确定特定研究人员最有趣的异常。我们的方法在识别最有趣的100个异常(由Galaxy Zoo 2志愿者判断)方面是100%准确的。第三个任务是调整模型来仅使用少数新标记的星系解决新任务。与从陆地图像(ImageNet)或从头开始训练的模型相比,从我们的表示形式进行微调的模型可以更好地识别环形星系。我们用很少的新标签解决每个任务;一个(用于相似性搜索)或数百个(用于异常检测或微调)。这挑战了长期以来的观点,即深度监督方法需要新的大型标签数据集,以便在天文学中实际使用。为了帮助社区受益于我们验证的模型,我们发布了我们的微调代码Zoobot。没有先前经验的研究人员可以访问Zoobot。
translated by 谷歌翻译
Novel topological spin textures, such as magnetic skyrmions, benefit from their inherent stability, acting as the ground state in several magnetic systems. In the current study of atomic monolayer magnetic materials, reasonable initial guesses are still needed to search for those magnetic patterns. This situation underlines the need to develop a more effective way to identify the ground states. To solve this problem, in this work, we propose a genetic-tunneling-driven variance-controlled optimization approach, which combines a local energy minimizer back-end and a metaheuristic global searching front-end. This algorithm is an effective optimization solution for searching for magnetic ground states at extremely low temperatures and is also robust for finding low-energy degenerated states at finite temperatures. We demonstrate here the success of this method in searching for magnetic ground states of 2D monolayer systems with both artificial and calculated interactions from density functional theory. It is also worth noting that the inherent concurrent property of this algorithm can significantly decrease the execution time. In conclusion, our proposed method builds a useful tool for low-dimensional magnetic system energy optimization.
translated by 谷歌翻译
The release of ChatGPT, a language model capable of generating text that appears human-like and authentic, has gained significant attention beyond the research community. We expect that the convincing performance of ChatGPT incentivizes users to apply it to a variety of downstream tasks, including prompting the model to simplify their own medical reports. To investigate this phenomenon, we conducted an exploratory case study. In a questionnaire, we asked 15 radiologists to assess the quality of radiology reports simplified by ChatGPT. Most radiologists agreed that the simplified reports were factually correct, complete, and not potentially harmful to the patient. Nevertheless, instances of incorrect statements, missed key medical findings, and potentially harmful passages were reported. While further studies are needed, the initial insights of this study indicate a great potential in using large language models like ChatGPT to improve patient-centered care in radiology and other medical domains.
translated by 谷歌翻译
Efficient surrogate modelling is a key requirement for uncertainty quantification in data-driven scenarios. In this work, a novel approach of using Sparse Random Features for surrogate modelling in combination with self-supervised dimensionality reduction is described. The method is compared to other methods on synthetic and real data obtained from crashworthiness analyses. The results show a superiority of the here described approach over state of the art surrogate modelling techniques, Polynomial Chaos Expansions and Neural Networks.
translated by 谷歌翻译